Národní úložiště šedé literatury Nalezeno 3 záznamů.  Hledání trvalo 0.01 vteřin. 
Page Segmentation in a Web Browser
Zubrik, Tomáš ; Polčák, Libor (oponent) ; Burget, Radek (vedoucí práce)
This thesis deals with the web page segmentation in a web browser. The implementation of Box Clustering Segmentation (BCS) method in JavaScript using an automated browser was created. The actual implementation consists of two main steps, which are the box extraction (leaf DOM nodes) from the browser context and their subsequent clustering based on the similarity model defined in BCS. Main result of this thesis is a functional implementation of BCS method usable for web page segmentation. The evaluation of the functionality and accuracy of the implementation is based on a comparison with a reference implementation created in Java.
Page Segmentation in a Web Browser
Zubrik, Tomáš ; Polčák, Libor (oponent) ; Burget, Radek (vedoucí práce)
This thesis deals with the web page segmentation in a web browser. The implementation of Box Clustering Segmentation (BCS) method in JavaScript using an automated browser was created. The actual implementation consists of two main steps, which are the box extraction (leaf DOM nodes) from the browser context and their subsequent clustering based on the similarity model defined in BCS. Main result of this thesis is a functional implementation of BCS method usable for web page segmentation. The evaluation of the functionality and accuracy of the implementation is based on a comparison with a reference implementation created in Java.
Interactive web crawling and data extraction
Fejfar, Petr ; Ježek, Pavel (vedoucí práce) ; Nečaský, Martin (oponent)
Název práce: Interaktivní procházení webu a extrakce dat Autor: Bc. Petr Fejfar E-mailová adresa autora: pfejfar@gmail.com Katedra: Katedra distribuovan˝ch a spolehliv˝ch systémů Vedoucí práce: Mgr. Pavel Je ek, Ph.D., Katedra distribuovan˝ch a spoleh- liv˝ch systémů Abstrakt: Tato práce se zaměřuje na problematiku automatického procháze- ní stránek a extrakce dat v kontextu moderních webov˝ch aplikací, obsahu- jících vysoké mno ství aplikační logiky implementované v prohlí eči pomocí JavaScriptu. V práci je provedena anal˝za moderních webov˝ch stránek, spolu s tech- nikami, které jsou be ně pou ívany k extrakci dat. Na základě této anal˝zy jsme navrhli nástroj, kter˝ moderní webové stránky prochází na základě instrukcí zadan˝ch u ivatelem pomocí grafického prostředí. Narozdíl od ostatních nástrojů na procházení a extrakci dat z moderních webov˝ch strá- nek, náö nástroj umo nuje práci u ivatelům, kteří nemají zkuöenosti s pro- gramováním. Navhrhovan˝ nástroj je implementován jako webová aplikace a vyu ívá pro- tokolu WebDriver pro automatizaci více prohl ečů pro procházení a extrakci dat z webov˝ch stránek pomocí u ivatelem definovan˝ch posloupností in- strukcí. Náö nástroj umo ňuje u ivateli prozkoumat aktuální stav prohlí eče extrahujícího data zobrazením aktuálně prochazené stránky. Toto...

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.